单细胞时代 || NGS技术实现
作者 | 周运来
男,
一个长大了才会遇到的帅哥,
稳健,潇洒,大方,靠谱。
一段生信缘,一棵技能树。
生信技能树核心成员,单细胞天地特约撰稿人,简书创作者,单细胞数据科学家。
Single-Cell RNA Sequencing and Its Combination with Protein and DNA Analyses
这不是最好的时代,也不是最坏的时代,这里是单细胞时代。灵活的单细胞系统,高效的组织解离液,开源的数据分析工具,端到端的单细胞解决方案是未来发展的趋势。这里最主要的是开放灵活的单细胞系统,有了这个系统我们就可以自主地设计反应体系,来从不同纬度捕获单个细胞的信息。
我们知道单细胞技术体系中最成熟的要数scRNA-seq了,数据分析也基本上是围绕RNA展开的。在2021年的当下,单细胞数据科学的数据基础主要有:
表达谱:大部分解析异质性的方法都是基于表达谱的,如分群/注释/轨迹推断/功能富集。转录调控等 比对结果:这里就有转录本的结构信息,可以得到等位基因/转录本剪切等情况(当然是技术平台而定) 自定义新的seq技术。单细胞就像一个巧克力盒,大家都在从里面拿黑巧克力,我们设计一个seq方法可以同时抓到黑白两种巧克力,这不是很爽吗?(高阶玩法,欢迎临摹)
我们所说的单细胞时代,狭义地说,是高通量单细胞测序时代,这当然离不开NGS(Next Generation Sequencing)。本文回顾了传统的单细胞测序技术,如Cel-seq, smart-seq,考察了微流控技术,重要的是,也关注了几种同时测定多模态的NGS单细胞技术。
考察这些技术的发展和迭代(如smart-seq 1 到 2到3 ),我们直观的体会是:
通量,通量,通量 成本,成本,成本 效率,效率,效率
技术发展不会停滞,成本节约永远向前。单细胞技术会带领一部分传统实验室转向芯片实验室(Lab-on-a-chip)。chip-based技术配上bioinformatics,生命科学的科研新范式已经在不少实验室建立起来,而有的人还在观望。让观望的人继续观望吧,我们永不停歇。
细胞群体的异质性对理解复杂的细胞生物学过程提出了重大挑战。在单细胞水平上对细胞进行分析,特别是单细胞RNA测序,使得全面剖析细胞异质性成为可能,而传统bulk分析无法获得如此丰富的生物信息。最近的研究已经将scRNA-seq与基因组或蛋白质组数据结合起来,并且在描述复杂的细胞异质性方面比单独的转录组更有价值。随着生物医学和临床应用对scRNAseq的需求不断上升,迫切需要对scRNA-seq技术及其潜在的生物医学应用进行及时和全面的综述。在这篇综述中,我们首先通过详细介绍每一种scRNA-seq技术,包括传统和微流技术来讨论最新的发展状况。随之,我们总结了它们的优点和局限性以及它们在生物医学上的应用。最后,简要讨论了scRNA-seq技术商业化的进展与挑战。
细胞是生物体的基本结构和功能单位。传统的复杂组织RNA测序通常掩盖了每个细胞的特异性。不同的细胞通常作用于一个组织或器官的整体功能来承担特定的角色。因此,在单细胞水平上进行转录组分析,对于提高对与生理功能和人类疾病相关的生物学过程复杂性的理解具有重要意义。
单细胞rna测序揭示了单个细胞的特异性,因此,解决了bulk分析无法解决的问题。已被应用于发现新的细胞类型,探索发育生物学过程的动力,识别基因调控机制等。例如,通过scRNA-seq可以分辨不同的细胞亚群,从而可以表征细胞群的异质性。此外,还可以识别罕见细胞类型,为的疾病诊断和治疗提供有价值的见解。因此,强大的scRNA-seq技术的发展在细胞水平上理解组织和器官功能方面具有潜力,这对于促进诊断和治疗医学的进步起着重要的作用。
传统的scRNA-seq技术最初包括使用口吸液管、微量吸液管或荧光激活细胞分选(FACS)以及手工分离细胞。虽然这些技术可以扩大规模并实现自动化,但它们仍然耗时且困难。微流体技术的最新进展通过将半自动化操作集成到一个更简单的设备中,为scRNA-seq开辟了新的途径。例如,以阀为基础的微流体装置已经被开发出来,利用微阀门捕获或捕获反应室中的单个细胞,在那里细胞被裂解,其mRNA被反向转录并扩增。
值得一提的是,微流控技术涉及的操作步骤更少,通量更高。微流体液滴装置也被引入,用于将单个细胞封装在含有试剂的小体积液滴中。然后,细胞裂解,分选,准备文库和测序。具体来说,这些技术提供了几个优势:减少了所需试剂和样品的体积,减少了操作步骤,高分析灵敏度和特异性以及高通量。
此外,纳米cell技术还具有操作简单、样品和试剂体积要求低、能够检测细胞表型(如细胞形状和大小)等优点。这些功能允许用户调优细胞加载密度、识别细胞或多细胞、确定细胞生存能力,并识别感兴趣的细胞,以便更有效地进行下游分析流程。
关于介绍scRNA-seq技术的综述文章已经很多了。然而,大多数研究主要关注技术原理、微流控制造或单一组学。到目前为止,鉴于scRNA-seq技术的进步,迫切需要对scRNA-seq技术及其与基因组和蛋白质组研究的整合进行及时和全面的考察。在这篇综述中,我们首先讨论了该领域的最新发展,详细介绍了每一种scRNA-seq技术,包括传统的和当前的微流体技术(图2)。
传统scRNA-seq技术
下面我们来逐一介绍。
Smart-Seq 1 and 2
RNA模板5 '端交换机制(Switching Mechanism at 5′End of RNA Template,Smart-seq)的引入是为了解决之前技术的局限性,如有限的通量和跨转录本的读取覆盖率。简单地说,人工挑选单细胞并在逆转录酶(moloney murine leukemia virus, moloney)中裂解,具体反应由含oligo(dT)引物启动。当逆转录(RT)到达RNA分子的5 '端时,一些C核苷酸被添加到cDNA的3 '端进行第一条链的合成。在模板转换oligo (TSO)存在的情况下,模板被RT转换并合成了cDNA的第二链。随后使用聚合酶链反应(PCR)扩增全长cDNAs,以获得几毫微克的DNA。然后根据Nextera Tn5转座子制备Illumina测序文库。这项技术极大地提高了转录物的覆盖范围,增强了单核苷酸多态性的评估或候选生物标记物的鉴定。
它对研究罕见细胞的转录组态特别有用。
引入Smart-seq 2是为了应对Smart-seq 1的低收益、覆盖率和敏感性差的挑战。它改善了RT、模板转换和前置扩增过程,以增加单细胞生成的cDNA文库的长度和产量。用锁定核酸(LNA)取代tso3 '端,使cDNA产量加倍,由于增加了na - dna碱基对的热稳定性,在Smart-seq 1中出现了TSO。甲基供体甜菜碱的使用和较高浓度的MgCl2显著提高了cDNA的产量。在RNA变性之前加入脱氧核糖核酸三磷酸(dNTP)可以增加预扩增的cDNA平均长度,这可能是由于RNA-oligo(dT)引物杂交的稳定性。在预扩增过程中使用KAPA HiFi热启动DNA聚合酶可以提供良好的扩增效果和更大的cDNA长度(即增大450 nt)。因此,除了提高稳定性外,Smart-seq 2还提高了从单细胞生成的cDNA文库的长度和产量,以及检测的覆盖率、偏倚和准确性。使用微移管耗时的细胞分离过程和细胞数量少则是为Smart-seq的局限性。
SCRB-seq
单细胞RNA条形码和测序(SCRB-seq)被引入用于分析来自大量细胞的mRNA,使用最少的试剂和每个细胞的测序reads。该方法基于Smart-seq开发,仅使用细胞特异性条形码和唯一分子标识符(UMI)进行3 '端测序。单细胞通过流式细胞仪被分成384孔板。RT使用由barcodes、UMI和poly(T)引物组成的RT引物进行。合成的cDNA被汇集和扩增用于测序,使用的裂解方法富集3 '结束。SCRB-seq允许深度、全长的转录组覆盖测序,能够测序约12000个单细胞。与Smart-seq不同的是,这项技术包括使用细胞条形码,以便更容易地识别来自同一细胞的读取。然而,对大量单细胞进行测序仍然具有挑战性。
这种方法适用于在异质群体中发现转录组。
CEL-seq 1 and 2
细胞线性扩增表达测序(Cell Expression by Linear Amplification and Sequencing (CEL-seq) )主要依赖体外转录对cDNA的线性扩增。该协议允许条形码样本的合用而放大效率。使用微管人工将单细胞转移到试管中。在每个细胞裂解后,一个尾部的寡核苷酸(dT)被用于初始化从5 '端到3 '端,末端寡核苷酸(dT)的序列为T7启动子,细胞条形码和poly(T)引物。然后合成第二链cDNA,生成含有T7启动子的双链cDNA。将这些cDNAs汇集在一起,启动体外转录反应以实现cDNA的线性扩增。生成的扩增子被片段化到适合测序的大小分布。这项技术被用于研究早期秀丽隐杆线虫胚胎细胞,并证明了即使只有细微的生物学差异也可以区分细胞类型的可能性。
本质上,CEL -seq涉及3 '端cDNA覆盖,比全长cDNA覆盖提供了一个更敏感和可复制的结果。与Smart-seq相比,CEL-seq在早期就添加了条形码,专门识别每个单细胞。因此,这减少了动手的工作。但该技术只能用于3 '端测序,提供的转录组信息比全长转录序列少。改进的CEL -seq方法:CEL -seq 2在条形码上游增加了一个5碱基对UMI,用于鉴定scRNA-seq[14]的PCR重复物,显著提高了准确性。利用superscript II双链cDNA合成试剂盒,结合缩短CEL-seq引物,显著提高了RT效率,从而提高了检测灵敏度。此外,与原始的CEL -seq相比,CEL -seq 2多检测了30%的基因。现成的试剂也被用于生成单细胞转录组库,这使得它们可以被大多数实验室使用。与Smart-seq不同的是,在CEL-seq中使用细胞条形码可以更好地识别单个细胞。类似于Smart-seq, CEL -seq使用微移液管进行细胞分离,这使得整个过程非常耗时。
MARS-seq 1 and 2
大规模并行RNA单细胞测序(MARS-seq)是在CELseq协议的基础上引入的,作为分析数千个单细胞转录组的自动化工作流程,同时最大限度地减少扩增偏差和标记错误。通过流式细胞仪,单细胞被分成384个孔板,RT使用T7启动子、部分Illumina adapter、细胞条形码和UMI和poly(T)引物。随后,自动化处理在汇集和标记的材料上进行了三层条形码(分子、细胞和板层),这极大地增加了通量和再现性。它可以用于定义细胞类型和细胞状态,并将这些与详细的基因组广泛的转录分析联系起来。
MARS-seq 2是MARS-seq的一种改进方法,合并索引FACS排序来丰富感兴趣的细胞。这一关键特征对于通过scRNA-seq鉴定稀有细胞亚群至关重要,例如一种独特的限制阿尔茨海默病发展的小胶质细胞。与MARS-seq相比,优化了实验流程,如优化RT引物浓度和组成以及在MARS-seq 2中加入RT引物去除步骤,极大地降低了技术细胞间的污染(背景噪声)。此外,MARS-seq 2使每孔细胞双峰最小化(0.2%),使scRNA-seq分析复杂化。这项技术执行FACS需要熟练的工人。然而,由于它的自动化过程,与上述技术相比,它最小化了采样偏差,简化了步骤。
Quartz-seq 1 and 2
Quartz-seq是一种基于均聚物尾矿PCR(homopolymer tailing-based PCR)的简单而高定量的scRNA-seq方法。除了评估同一类型细胞之间的转录组异质性,它还检测在同一细胞周期阶段的细胞之间的转录组异质性。
由于基于同聚物尾矿的PCR倾向于产生意想不到的副产物,使scRNA-seq分析复杂化,Quartz seq增加了一个RT引物去除步骤,并使用抑制PCR技术来减少副产物的合成。这就消除了复杂的副产品去除方法的需要。通过流式细胞仪将单细胞分列成管状并裂解。利用含有一个PCR靶区的RT引物,mRNA被逆转录为第一链cDNA。未反应的RT引物被外切酶1消化,并在cDNA的3 '端和任何剩余的RT引物上添加poly(a)尾。利用含有poly (dT)序列的标记引物进行第二链cDNA合成,生成的cDNA和副产物均含有整个转录组扩增(WTA)接头序列(标记引物和RT引物序列)。然后dna通过抑制PCR去除副产物,获得高质量的cDNA用于Illumina测序。Quartz-seq与Kurimoto等人的方法相比,后者需要对单个细胞使用多个PCR管。与Smart-seq相比,Quartz-seq是高度定量的,可以检测更多的转录。
quartz - seq2的一个关键特征是,它能够以有限的序列分析单细胞转录组。通过流式细胞仪将单个细胞分类到384孔板中,使用包含UMI序列和细胞条形码序列的RT引物进行细胞条形码编码。此外,通过优化poly(A)尾段缓冲液和增加第二链cDNA合成步骤的升温条件,提高了poly(A)尾标记策略的效率。quartz - seq2的UMI转换效率(32%-35%)高于cell-seq 2、SCRB-seq和MARS-seq(7%-22%),这是允许使用quartz - seq2以最小的成本从有限的序列中检测更多的转录本。类似于MARS-seq,这项技术需要熟练人工的FACS。
SUPeR-seq
单细胞通用poly(A)-independent RNA测序(SUPeR-seq)是一种基于均聚物尾端PCR的scRNA-seq方法,可以对聚腺苷和非聚腺苷的RNA进行测序。环状RNA是一种非聚腺苷化RNA,通过交替剪接形成,被认为在microRNA中结合并抑制几个重要的细胞功能。用口吸液管人工提取单细胞并裂解以释放聚腺苷化和非聚腺苷化RNA。然后,利用固定锚点序列的随机引物(AnchorX-T15N6)对这两种rna进行第一链cDNA合成。使用掺杂1% ddATP的dATP将poly(A)尾添加到第一站cDNA的3 '端。不同锚定序列的Poly(T)引物 (AnchorY-T24)然后用于合成第二链cDNA,这是随后的PCR使用深度测序前的AnchorY- t24和AnchorY- t15引物。
该技术被用于研究环状rna在哺乳动物早期胚胎发育中的作用,并证明了其检测小鼠着床前胚胎中环状和聚腺苷化rna的能力。使用口吸管耗时的细胞分离过程和低通量是为缺点。
MATQ-seq
与SUPeR seq不同的是, multiple annealing and dC-tailing-based quantitative single-cell RNA-seq (MATQ-seq)采用UMI和barcode对聚腺苷化和非聚腺苷化RNA进行测序。将每个单细胞用口管送入PCR管中,裂解以释放总RNA。非聚腺苷酸RNA和聚腺苷酸RNA通过基于多重退火和环基扩增周期的引物进行第一链cDNA合成(MALBAC),主要含有T、A、G碱基和MALBAC- dt引物。然后,首先对第一链cDNA进行poly(C)尾迹处理,然后使用g富集的MALBAC引物进行第二链cDNA合成。随机引入六聚体UMI序列,在PCR扩增前对第二链cDNA进行标记,进行Illumina测序。MATQ-seq证明,与Smartseq 2和SUPeR-seq相比,使用UMI显著降低了HEK293T转录本的3 '端或5 '端偏置。在检测单个HEK293T细胞中提取的非聚腺苷酸RNA方面,MATQ-seq比Smart-seq 2和SUPeR-seq更敏感。此外,MATQ-seq检测低丰度基因的能力高于Smart-seq2。总的来说, MATQ-seq为检测相似细胞类型的单细胞之间的转录组异质性提供了高精度和敏感性。
与SUPeR-seq相似,MATQ-seq使用口移液管进行细胞分离,这使得过程耗时且通量低。
微流控单细胞技术
虽然前面提到的技术可以自动化,以减少分析成本,但它们仍然是劳动密集型的。为此,已经开发了几种微流体技术,如阀基、液滴和纳米晶片的scRNA-seq技术。表中总结了基于微流体的scRNA-seq技术,这些技术允许以低成本的方式对数千个细胞进行测序,下面将详细讨论。
Valve-Based scRNA-seq Technologies
一种分离单细胞的技术是基于阀(Valve-Based)的技术。以阀为基础的技术通常依靠专用的结构来操作,如通道和压力控制器。它们的性能通常优于传统的scRNA-seq技术,因为它们减少了人工处理和移液管造成的变化,从而实现了更高的重现性,从而实现了更高的灵敏度和准确性、更高的通量和更低的交叉污染风险。
Multilayer Microfluidic Device for scRNA-seq
为了克服传统技术的缺点,一种集成阀的多层微流控装置被开发出来,从单细胞中制备用于scRNA-seq的cDNA,提高了灵敏度和精度(图3A)。
从培养细胞中获得单细胞悬浮液,并将其注射到所述入口通道中。捕获并分选单细胞,进行后续的细胞裂解和RT反应,然后进行芯片外扩增和文库准备。半自动程序允许一致的操作时间(例如,装载和混合),这将技术错误最小化,并提高重现性。所有步骤的总反应体积约为140发热量L,比常规台式技术(90发热量L)低约600倍。然而,该技术的缺点是需要芯片外放大和低通量。这项技术可以识别单个细胞的差异表达基因,这为以敏感和精确的方式测量细胞群体的生物变异提供了巨大的希望。
Microfluidic Hydrodynamic Trap Array for scRNA-seq
开发了一种微流体动力阱阵列,可在培养条件控制下,通过多代谱系跟踪,对单细胞进行芯片外转录组测序。这个阵列由20个阱组成,通过阀门对压力进行独立控制,使连续灌注能够长期生长,并使单细胞从装置中释放出来。将单个细胞装载到trap阵列的每个泳道中,孵育72 h以促进细胞增殖。一旦细胞增殖,子代被传递并被随后的阱捕获。整个过程经过时移成像,这允许增殖动力学的确定和谱系跟踪。根据Smart-seq 2协议对细胞进行测序,Smart-seq 2协议将转录测量与谱系信息联系起来。长时间培养的生长动力学是稳定的,倍增时间一致,这表明该装置不会干扰[的长期细胞增殖。这项技术提供了在单细胞分辨率研究多代发育的潜力,这对癌症、免疫学和发育生物学领域很重要。
MID-RNA-seq
采用微流控扩散基RNA-seq (MID-RNA-seq)进行扩散基试剂交换方案的scRNAseq(图3B)。该装置包括细胞捕获、裂解、RT和PCR扩增,并通过气动微阀控制流体流量。该技术利用浓度梯度驱动扩散的优势,将试剂输送到反应室,同时消除了之前步骤中的试剂影响。
通过样品入口将单细胞悬浮液引入装置。通过操作阀门,单个细胞被困在腔室中。用磷酸盐缓冲盐(PBS)和裂解缓冲液冲洗。裂解缓冲液扩散,将被捕获的细胞移至反应室进行裂解反应。采用相似的扩散过程进行RT和PCR,洗脱缓冲液洗涤后收集cDNA进行文库制备和测序。然而,与大多数传统技术不同的是,它支持自动化处理和多路复用。该技术的结果与传统的scRNA-seq技术相当。与上述基于阀的微流体技术一样,该技术需要复杂的器件制造工艺。
Hydro-seq
引入水动力scRNA-seq (Hydro-seq)是为了解决现有的scRNA-seq技术带来的低吞吐量和电池捕获效率低下的挑战(图)3 c)。Hydro-seq利用基于大小的单细胞捕获方案捕获罕见细胞,如循环肿瘤细胞(CTCs),实现了>70%的细胞捕获效率。
一旦样品加载完毕,捕获阀就关闭,细胞就会随着珠一起流过捕获点,靶细胞就在捕获点被捕获在腔内。注射裂解缓冲液,关闭腔内所有阀门。细胞被裂解,其mrna被珠捕获。然后通过打开所有阀门并引入下游scRNA-seq的回流来回收珠子。该腔可扩大到数千个,用于大规模平行富集和稀有细胞的分析。与其他技术相比,该技术提高了小区捕获效率和通量。hydro-seq的效用通过对CTCs进行测序和确定肿瘤生物标记物的转录组异质性得到证实,以了解转移过程和监测癌症患者的靶向治疗。
Droplet-Based scRNA-seq Technologies
介绍了液滴微流控技术,主要涉及将单细胞封装在惰性载体油中的液滴中。载体油的使用使液滴能够移动、合并、分离、加热或存储。这些技术速度快通量大。此外,可以在几秒钟内对数千个细胞进行分选,这对于大型应用程序非常理想。
Hi-SCL
为scRNA-seq开发的第一个基于液滴的微流体技术是高通量单细胞标记(Hi-SCL)。该技术将单个细胞封装在液滴中,大大降低了每个细胞的封闭体积,特别是与传统纳米技术中常用的微升体积相比。然后,每个液滴与另一个包含裂解缓冲液、RT缓冲液和DNA条形码的液滴融合,这些DNA条形码可以唯一地标记单细胞转录组。液滴随后被放大并测序。乳剂中液滴之间的低污染风险通过混合人类和小鼠细胞得到证明,这表明大多数读取来自每个独特的物种。这项技术被用于测量来自小鼠胚胎成纤维细胞和小鼠胚胎干细胞的数百个细胞的RNA水平。从本质上说,尽管这项技术的电池捕获效率很低,但它使条形码成为可能,并增加了筛选更多电池的能力。这显示出了一种潜力,可以极大地扩展微流体的能力,以高通量的方式表征单细胞。
In-Drop
与Hi-SCL相似,分度液滴(in - drop)的反应在液滴中进行,允许对数千个细胞进行RNA-seq(图4A)的分度。微流控装置由四个输入载体油、细胞、裂解液或RT试剂的入口,一个携带条形码引物的水凝胶微球和一个收集液滴的出口组成。水凝胶微球通过光释放键与细胞条形码共价连接。
每个条码由一个细胞条码、一个UMI、一个Illumina测序引物、一个T7 RNA聚合酶启动子和一个oligo(dT)尾巴组成。细胞封装后,细胞被裂解,通过暴露于紫外光下,条形码从微球中释放出来。在RT过程中,每个液滴的cDNA都被标记上条形码,然后根据cell -seq协议进行扩增和测序。该方法被优化以最大限度地降低包封双晶和产生的风险90%的液滴包含一个细胞和一个微球。这项技术使大量细胞的scRNA-seq成为可能,这使得从异质群体中识别非常罕见的细胞类型成为可能。与上述技术相比,In-Drop技术采用水凝胶微球引入寡核苷酸。在液滴中进行裂解和RT,以简化操作过程。然而,In-Drop的主要缺点是极低的细胞捕获效率(~7%),只能检测到每个细胞的20-50拷贝转录。
Drop-seq
Drop-seq与In-Drop有一些相似之处,In-Drop也包括一个用条形码封装每个单细胞的液滴(图4B)。与使用条形码水凝胶的In-Drop不同39个微球中的21个,这项技术使用条形码微球。珠上的寡核苷酸包括用于扩增的手柄序列、识别单个细胞中所有寡核苷酸的细胞条形码、UMI和捕获单细胞mRNA分子的寡核苷酸(dT)序列。
细胞被分离成小滴后被裂解,mRNA分子的多聚(A)尾与小珠上的寡聚(dT)尾杂交,形成单细胞转录组附着在其上微粒子((STAMPs)。然后液滴被打碎,并在单管中接受RT。随后使用Nextera XT试剂盒进行PCR和片段化。与前面提到的技术相比,该技术以更便宜和更快的方式实现了高吞吐量分析(每天约10,000个单细胞库)。细胞捕获效率约为12.8%,高于In-Drop法。然而,与In-Drop类似,只能使用3 ' most末端片段进行测序。
10x Genomics
如上所述,基于水滴的技术支持同时快速处理数千个单元,但是目前的技术具有中等吞吐量,这需要使用定制的试剂(图4C)。为了克服这些缺点,一种基于油滴的技术,即10x基因组公司开发的这项技术能够对数千个单细胞中的3 '信使RNA (mRNA)进行数字计数。
乳状液中的凝胶珠(GEM)是这项技术的核心,它集成到基于水滴的微流体装置中,能有效捕获大约50%的负载细胞。每个凝胶珠均由条形码寡核苷酸功能化,寡核苷酸由illumina适配器、10倍条形码、UMI和寡核苷酸(dT)组成,寡核苷酸可引导聚腺苷化rna的RT。细胞包封后立即开始细胞裂解。然后凝胶珠溶解并释放出用于RT的寡核苷酸。RT在液滴内进行,并转移到发生cDNAs扩增的试管中。带有Illumina适配器和样本索引的扩增子允许同时汇集和测序多个库。测序数据可以通过分析管道快速处理。
MULTI-seq
使用脂质标记指标进行单细胞RNA测序(MULTI-seq)的多路复用技术允许将DNA条形码定位到乳状液液滴中的单个细胞中进行scRNA-seq测序。单细胞首先通过一对脂质修饰的寡核苷酸(LMO)杂交标记,分别与5 '木质素酸酰胺和3 '棕榈酸酰胺结合到细胞膜上。该LMO包括一个5 ' PCR、一个8-bp DNA条形码和一个3 ' poly(a)捕获序列。使用10x Genomics Chromium系统,每个单细胞携带封装的LMOs和一个mRNA捕获珠到乳剂液滴中,随后细胞裂解释放RNA和LMOs。细胞mRNA和LMOs都与mRNA捕获珠杂交,然后在RT期间连接到一个共同的细胞条形码,这允许样本多路复用。扩增后,LMO片段通过大小选择从mRNA中分离出来,然后进行下一代测序(NGS)文库准备。这种技术被用于在不同转移进展阶段从病人来源的异种移植小鼠模型中分离出的冷冻保存的肺和原发性乳腺肿瘤。通过揭示几种免疫细胞对乳腺肿瘤肺转移的反应,MULTI seq的效用被成功证明。由于每个单细胞都用多个指数标记,MULTI-seq能够容易地识别和去除细胞双态,并提高设备的通量。该技术的一个缺点是只能使用3 ' most末端片段进行测序。
Nanowell-Based scRNA-seq Technologies
最近,纳米维尔技术被开发出来,与基于水滴的设备相比,纳米空技术在单细胞分析方面有几个优点,包括细胞加载周期短、试剂和样品体积低、与光学成像的兼容性增强。执行光学成像的能力允许用户通过在库准备之前提供更多的细胞信息来检查和调整细胞装载密度、识别多胞胎和确定细胞生存能力。下面几节将简要讨论这些技术。
Cytoseq
基因表达细胞仪(Cytoseq)可以对含有珠子的纳米细胞中的单细胞RNA进行大规模并行随机条码编码,从而可以同时对数千个单细胞进行基因表达谱分析。将细胞加入纳米管中,显微镜下观察。将小珠装上以饱和所有孔,并加入新鲜的裂解缓冲液。通过在纳米管阵列上放置一块磁铁,这些带有捕获到的mrna的珠子就会被回收。在进行扩增和测序之前,使用上标II或III进行cDNA合成。与Drop-seq类似,细胞中的所有mRNA分子都用独特的细胞条形码进行标记,每个转录本都用UMI进行索引,这使得mRNA转录本能够被数字化计数。Cytoseq的效用通过鉴定罕见细胞和描述免疫反应中的细胞异质性得到证实。尽管这种技术不是完全自动化的,但它使简单的制造过程和高通量分析成为可能。这项技术将有助于更好地了解复杂生物系统的细胞多样性,为未来的临床应用。
Microwell-seq
为了对细胞群进行更全面的转录组分析,microwell-seq使用琼脂糖构建的纳米管来分析数千个单细胞(图5A)。硅微阵列用于构建微柱聚二甲基硅氧烷(PDMS)芯片,随后用于创建琼脂糖纳米晶阵列。与Cytoseq一样,每个磁珠都被装入孔中,在捕获单细胞mrna后由磁铁回收。RT、扩增和文库制备均遵循smart - seq2协议。“小鼠细胞图谱”由来自51只小鼠组织、器官和细胞的400k单细胞转录组谱构建,涵盖了小鼠系统中800多种主要细胞型和1000多种细胞亚型。
与Cytoseq不同的是,该技术能够在采样处理之前的成像基础上去除细胞双极体,从而产生更高质量的数据。像其他Nanowell技术,这项技术不是完全自动化的。未来的工作将进一步简化操作过程,并整合数据来创建一个全面的哺乳动物细胞图谱,这将有助于科学研究和临床应用。
Seq-well
最近,Seq-well被开发出来,它利用纳米管阵列的优势来实现大规模并行scRNA-seq(图5B)。在玻片上制备了薄层PDMS纳米管。芯片上进行细胞裂解和RT。Seq-well的一个主要优点是使用了半渗透的聚碳酸酯膜(10纳米孔径),该膜可以可逆地附着在Seq-well上 通过选择性化学功能化的纳米管。这一特性允许快速的溶液交换裂解单细胞和捕获生物大分子,以减少交叉污染,实现高效捕获mrna。
该阵列的三层功能化表面由氨基硅烷碱基通过对苯二异硫氰酸中间体与双功能聚(谷氨酸)壳聚糖交联而成。在阵列的顶表面的壳聚糖允许有效的封闭膜,而聚(谷氨酸)在阵列的内表面抑制非特异性mRNA结合。细胞裂解后,将阵列转移到新的皿中并倒置,使PDMS表面与皿中接触,以便离心后收集小珠。库的准备是基于Drop-seq协议。该技术被用于对暴露于结核分枝杆菌的数千个原发人巨噬细胞进行测序。它能够处理小数量的样本,并与阵列成象细胞仪兼容,用于从复杂的生物样本中识别细胞表型。
SCOPE-seq
单细胞光学表型和表达测序(SCOPE-seq)被开发出来,它能够基于每个细胞的表型特征来识别它们,并将表型信息与scRNA-seq数据链接起来(图5C)。使用光学解码或双条形码珠,由Drop-seq珠产生,通过在分裂池结扎的两个循环中从一组12个寡核苷酸中选择唯一的组合来连接寡核苷酸。利用光学条形码,样品的身份被连接到一个测量,允许每一个光学解码珠被序列荧光杂交解码。小珠与寡核苷酸结合,寡核苷酸由细胞条形码、UMI和用于文库准备和RNA测序的3 ' -poly(dT)序列组成。微珠和细胞随机分布在PDMS纳米细胞阵列中,一旦微珠捕获到单细胞mRNA,纳米细胞阵列就被切割成多个片段。然后提取珠进行文库准备。最后,对图像进行处理,以识别每个珠子上的光学条形码,并识别相应的条形码,将单个细胞显微镜数据,如细胞活力、多重检测、细胞/细胞核大小和形态、表面标记蛋白表达水平、细胞信号动力学和行为与RNA-seq数据相连接。和Seq-well一样,这项技术也包括用全氟油密封纳米管,以减少井间的污染,而且它不是完全自动化的。在未来,微珠可以大规模制备,这使其成为将高通量显微图像与测序数据相关联的强大技术。
scFTD-seq
为了进一步简化步骤,单细胞冻融裂解直接针对3 ' mRNA测序(scFTD-seq)的微芯片被开发用于执行scRNA-seq使用细胞经过冻融溶解。与前面提到的技术相似,该技术使用了PDMS Nanowell。将细胞和微珠装入纳米管阵列,并引入弱裂解缓冲液。对于封闭的纳米套管,使用玻璃载玻片仔细密封阵列,而对于开放的纳米套管,使用氟化油作为密封剂以减少交叉污染。将冻融裂解法应用于每个含珠纳米细胞中,捕获mrna进行转录组测序。与Seq-well方法类似,阵列被转移到一个倒置方向充满PBS的孔板上,离心将微珠释放到PBS溶液中。然后将溶液转移到离心管中,进行下游的RT过程。所述冻融溶解消除了通常需要复杂微流体装置的自动化流体交换的要求。由于在冻融裂解缓冲液中没有活性裂解成分,该技术不会立即启动裂解,从而最大限度地减少交叉污染。它兼容开放环境或封闭环境的细胞装载配置,这使得它非常适合应用在护理点设置和集中实验室。
scRNA-seq与蛋白质组分析的结合
如前所述,高通量scRNA-seq方法已被证明对描述复杂细胞群是有价值的。然而,现有的方法不能提供蛋白质组学信息,如细胞表面蛋白的表达。配对RNA和蛋白质分析揭示了基因表达和细胞表型的信息,提供了更详细的细胞亚群分类。一些特殊的生物信息学软件(例如,Cite-seq count)已经被引入来对原始测序reads中的UMI或antibois标记的寡核苷酸进行计数。为了同时测量转录组和细胞蛋白,并从单个细胞产生高效读出,已经开发了几种微流控技术。这些技术被总结在表3和下面几节将对此进行描述。
Cite-seq
通过测序对转录组和表位进行细胞标引(Cite-seq),在单细胞水平上同时分析转录组和细胞表面蛋白丰度。该方法通过链霉亲和素-生物素相互作用将寡核苷酸的5 '端连接到抗体上。这些抗体是链霉亲和素标记的,而带有5 '胺修饰的DNA寡核苷酸使用nhs化学进行生物素化。这一过程导致二硫键的形成,在还原条件下将寡核苷酸与抗体分离。通过加入50 mM的二硫苏糖醇(DTT)缓冲液,可以裂解附着在寡核苷酸上的生物素间隔臂上的二硫键,从而产生高纯度的dna,单细胞被分选和裂解。mRNA和抗体标记的寡核苷酸与磁珠上的寡核苷酸(dT)引物结合。抗体标记的寡核苷酸含有用于识别的条形码和用于PCR扩增的手柄。按照Drop-seq协议执行ScRNA-seq。该方法允许同时检测大约13种表面蛋白和转录本。
Reap-seq
与Cite-seq相似,RNA表达和蛋白测序(Reap-seq)可以在单细胞分辨率下并行定量mrna和蛋白(图6B)。它能检测大约82种抗体和超过20,000种基因。这两种方法在DNA条形码与抗体结合的方式上有所不同。与Cite-seq不同,repe -seq利用单向化学,在氨基化DNA条形码和抗体之间产生稳定的小共价键,从而减少空间位阻和潜在的串扰。在高通量蛋白质分析中,最大限度地减少空间位阻是非常重要的,并且在未来将这种方法扩展到细胞内标记。这种方法很容易适用于现有的scRNA-seq平台,该平台比单独测量转录组更详细地评估了转录组和细胞表型。
Cite-seq和Reap-seq都使用了类似的方法,生成一个蛋白质读数并与单个细胞转录组一起进行测序。与流式细胞术检测细胞表面蛋白不同,这些技术使用DNA条形码来标记表面抗体。DNA条形码技术通过在单个测定中靶向不同的表位,使多种抗体的结合成为可能,这些表位可以通过测序来解决。这项研究对单细胞进行了更全面的分析,从而可以很好地区分细胞类型。它还可能被用于探索转录后基因调控。到目前为止,将技术扩展到检测细胞内蛋白和转录组仍然是一个挑战,特别是由于细胞通透性的要求,这可能会导致RNA降解。
PDMS Nanowell and seq
为了检测同一细胞的转录组和分泌组,一项研究开发了PDMSNanowell技术来研究细胞因子的分泌,然后进行下游转录组分析。PDMS被胶原包覆并装载单细胞。整个装置随后用抗体阵列密封,抗体阵列捕获单细胞分泌的细胞因子。使用32G注射器挑出具有理想分泌状况(即高肿瘤坏死因子(TNF)-分泌物)的单细胞进行后续RNA测序。过转录组分析,在小鼠巨噬细胞中发现了一组与TNF- a分泌相关的高共表达基因。这项技术可能使人们对免疫调节机制有更深入的了解,这为药物发现和医学治疗带来了巨大的希望。
scRNA-seq与DNA分析的结合
现有的scRNA-seq方法不能提供基因型信息,如gDNA拷贝数、染色体结构和数量。事实上,配对转录组和DNA分析揭示了DNA结构和拷贝数的变化对基因表达的影响。这将直接将细胞基因型(野生型或突变型)与其功能状态(细胞类型和状态)联系起来。例如,直接影响下游基因表达和调节转移的肿瘤驱动基因可以通过转录组学和DNA分析来识别。这种综合分析将增强我们对异质健康和疾病组织的群体结构和细胞特性的理解。目前的研究分别分析转录组和基因组数据。例如,在一项研究中,NODES算法和基因组分析工具包变体调用管道分别用于分析scRNA-seq和scDNA-seq数据。
为了将DNA分析和转录组测量集成到一个高效的单细胞反应中,已经开发了几种技术,如下所述。表4总结了这些技术。
DR-seq
gDNA-mRNA测序(DR-Seq)允许使用准线性扩增策略对同一单细胞同时进行转录和DNA分析,而无需将mRNA与gDNA进行物理分离(图7A)。用口吸液管挑取单个细胞,放入PCR管中。细胞裂解释放RNA和gDNA。使用适配器1-x (Ad-1x)和具有细胞特异性条形码的多t引物(5 ' Illumina适配器和T7启动子悬置),mRNA被反向转录为单链cDNA。然后,使用adaptor-2对cDNA和gDNA进行准线性全基因组扩增(WGA),已知adaptor-2在5 '端有一个确定的27-nt序列,后面跟着8个随机核苷酸。随着扩增过程的进行,大多数扩增子的两端都有AD-2。少量由cdna衍生的扩增子,其中一端为Ad-2,另一端为Ad-1x。一半的样品受PCR,随后去除Ad-2,并制备细胞特异性指标性Illumina文库,用于gDNA测序。另一半转化为双链cDNA,然后利用体外转录进行扩增,制备NGS RNA文库进行转录分析。DR-Seq被发现与现有的scRNA-seq方法一样有效,包括CEL-seq MALBAC。此外,DR-seq结果显示,单个癌细胞间基因表达的变异可能与gDNA拷贝数变异有关。
因此,DR-seq可用于确定病变组织和健康组织中gDNA拷贝数变化的转录后果。由于mRNA和DNA的扩增不需要物理分离,故DR-seq在分析时需要对编码序列进行硅屏蔽,以确定gDNA拷贝数的变化。
G and T-seq
与DR-seq相似,基因组和转录组测序(G和T-seq)可以同时进行单细胞DNA和转录组分析,以评估遗传变异对基因表达的影响。单个细胞可以通过流式细胞仪或手动的微移液器分离出来,然后放入96孔板的井中。细胞裂解释放RNA和gDNA,然后使用链霉亲和素磁珠功能化的生物素化寡聚物(dT)从gDNA中分离mRNA。mRNA与微珠结合后,在平板下方放置磁铁捕获微珠,以便收集含有gDNA的上清液。在转录组测序之前,mRNA受到on-bead WTA的作用,而gDNA受到WGA先于基因组测序。研究发现,G和T-seq能够指示单个细胞内染色体异常(如染色体间融合和染色体非整倍体)的转录后果。因此,G和T-seq可以帮助建立细胞间变异在疾病和正常发育过程中的染色体结构和数目的功能。与r -seq相比,G和T-seq不需要对编码序列进行硅掩模来识别基因组复制数变异,从而简化了数据分析过程。
SIDR-seq
除上述技术外,gDNA与总RNA的同时分离与平行测序(SIDR-seq)也被引入到gDNA与RNA的同时序列中(图7B)。bulk细胞首先与细胞特异性抗体结合的磁性微珠结合,然后将珠子标记的单细胞分选到48孔微板的孔中。低渗溶液被用来破坏一个细胞的质膜释放所有的细胞质RNA,而gDNA仍留在细胞核内。然后在培养皿下放置一块磁铁,以捕获带有珠子标记的单细胞,将RNA从gDNA中分离出来,从而收集含有总RNA的上清液。mRNA被反向转录并受到WTA在转录组测序之前,而gDNA在基因组测序之前经过WGA。与DR-seq、G和T-seq相比,SIDR-seq具有一些优势。首先,SIDR-seq在分析识别遗传变异时不需要对编码序列进行硅掩蔽。第二,SIDR-seq可以从物理上分离gDNA中的所有rna,包括mRNA和非编码rnaRNA(特别是长非编码RNA),它允许收集长非编码RNA用于癌症诊断的潜在应用。此外,SIDR-seq比对比对率高于DR-seq或nuclear -seq(单细胞基因组测序方法),重复比对率低于DR-seq。这项技术可以应用于更全面的研究细胞的异质性和复杂性。
CORTAD-seq
同步测序转录组和目标基因组区域(cortado -seq),可以在自动化的高通量微流控平台(Fluidigm C1)上同时评估同一单细胞内的转录组和基因组。Fluidigm C1可以捕获和处理多达96个单细胞用于gDNA和mRNA测序。单细胞裂解释放RNA和gDNA,然后mRNA转化为cDNA。然后使用特异性引物对gDNA和cDNA进行PCR。在基因组测序之前,利用基因分型引物对一半样本进行另一轮PCR扩增gDNA,同时减少cDNA的数量。另一半直接用于转录组测序。cortadi -seq显示,发生T790M突变的肺癌细胞的转录组与发生T790M野生型肺癌细胞的转录组略有不同。因此,它可以用于研究已知的靶向基因突变在各类癌症中的转录组分析。由于需要已知目标序列,因此该技术不适用于全基因组DNA分析以发现为目的。
scTrio-seq
除了基因组和转录组测序,单细胞三组测序(scTrio-seq)也分析来自同一细胞的表观基因组或DNA甲基(图7C)。有报道称表观基因组学在调控单细胞基因表达中起着重要作用[71]。首先使用口吸管将单个细胞转移到PCR管中,裂解仅释放mRNA。离心后,mRNA与含DNA的完整细胞核物理分离,收集含mRNA的上清液进行RT和cDNA扩增 (Smart-seq或cell -seq)在转录组测序之前。裂解完整的细胞核,将释放的gDNA分别进行WGA和亚硫酸氢盐转换进行基因组测序和DNA甲基组测序。scTrio-seq结果表明,启动子处的DNA甲基化可下调单细胞基因表达,基因体处的DNA甲基化可上调单细胞基因表达。根据每个单个癌细胞的多组学信息,可以识别出不同的癌细胞亚群,并确定亚群的恶性程度和转移潜力。总之,scTrio-seq可用于确定细胞群体特别是癌细胞中基因组和表观基因组异质性的转录后果。
商业化的单细胞转录组技术
到目前为止,有一些商用的scRNA-seq样品制备技术,包括基于液滴的和基于纳米线的技术(表1)。基于滴落的技术,如chromium system (10x genomics)(图8A)和in-Drop system (1CellBio),已启用高通量单细胞分析(> 10000细胞),并拥有密集的用户支持。
这些技术虽然比较先进,但也存在着一些局限性,如液滴脆性、泄漏风险、捕获效率低等问题,特别是在初始密度较低的情况下。否则,较高的初始细胞浓度会增加每个液滴中含有双态粒子或堵塞系统的几率。
Nanowell-based技术拥有数千个纳米管,每个纳米管都由单个与寡核苷酸偶联的微珠组成,可以捕获目标mrna,从而实现高通量分析。裂解前观察阵列,记录珠数、细胞数、细胞偶线数、空孔数等信息。可以优化珠和细胞的数量,以获得最大的测序效率。与基于水滴的技术不同,它们对用户友好,未经训练的用户很容易操作。它们还能处理少量的细胞,比如稀有细胞。此外,他们中的大多数可以进行基于细胞特征,表面标记,或形态学的细胞选择。
为了便于分离用于下游工艺的单细胞,引入了穿孔平台(Vycap)。这种技术的主要优点是能够分离出罕见的单细胞(例如,循环肿瘤细胞)来自真实样本。样品通过细胞隔离芯片进行过滤,该芯片由6000多个纳米孔组成,只有一个微孔。为了让细胞悬浮液流过微孔,应用低压在几分钟内将单个细胞分类成单个孔。后在每口包含单个细胞的井的底部打孔 ,用穿孔针和收集到微板或管。这项技术已经成功地收集了超过95%的选定细胞,这些细胞可以潜在地用于各种scRNA-seq应用。
结论
总之,最近的scRNA-seq技术的发展,如基于阀的、基于液滴的和基于纳米线的scRNA-seq技术使得对单个细胞的高灵敏度、高精度和高通量转录组分析成为可能。结合单细胞转录组数据和蛋白质组数据,可以理解转录组细胞状态如何转化为功能表型状态。此外,由于异质性可能在转录后和翻译后过程中都存在,它可能揭示出仅从scRNA-seq数据无法获得的表型细胞状态。整合转录数据和基因组数据,允许检测基因突变与转录组。这种整合可以深入了解癌症的演变,并帮助解决单靠RNA测序无法解决的医学难题,如解剖复杂的细胞免疫反应或确定肿瘤内的异质性。
未来研究的一个领域将是提高现有技术的效率,包括灵敏度、多路复用、吞吐量和成本效益。具体来说,考虑到分析更多细胞的需求,消耗品、劳动力和测序的成本仍然很高,这对大多数scRNA-seq技术的广泛实施构成了障碍。因此,降低总成本可能是关键的一步。开发具有高样品处理能力和低反应量的高通量技术(例如液滴或纳米技术)以及易于制造和操作的工艺可以以最小的成本实现高效的scRNA-seq。仪器的自动化将减少检测时间,减少人工干预。这将减少操作偏差,提高不同实验室的重现性。在达到上述标准的同时,测定灵敏度不应受到影响。
此外,目前的技术依赖于polyT启动,因此,只有聚腺苷化mrna被测序,这可能没有信息。对长链非编码RNA等非聚腺苷基RNA进行测序,对更好地理解基因调控和基因表达异质性具有重要意义。因此,这将有助于发展技术,允许测序这些分子,以提高效率和质量的scRNA-seq。
多组学的进一步发展将使我们对细胞类型和细胞状态有更全面的认识。例如,DNA测序和DNA甲基化可以通过长读测序与转录组一起检测,以获得更多的细胞信息。同时,应该创建专业的多组算法来同时分析不同层次的数据。与scRNA-seq集成的空间信息高分辨率捕获应扩展到包括抗体标签或其他核酸标签。
此外,live cell成像数据与scRNAseq数据的更大的联系可能允许对更复杂的表型进行测量。例如,细胞成像之前测序可以提供细胞表型信息(例如,细胞大小、形态和表面标记)和动态(如细胞生长增殖、分化、迁移、和信息交互),然后可以与相同的细胞的转录组通过提供更多的信息输出。将3D水凝胶(如聚乙二醇双丙烯酸酯或甲基丙烯酰明胶)纳入技术可以更好地理解体内单细胞反应。此外,使用组合索引或光学解码珠可以连接活细胞显微镜分析scRNA-seq以及检测多联体。更重要的是,需要一种用于下游分析的精确和简便的细胞检索技术。
除了技术进步之外,计算分析方法也在进步。关于scRNA-seq生物信息学的综述文章来源广泛且容易获得。分析scRNA-seq数据的挑战之一是由于初始细胞浓度低或转录检测效率低而带来的技术噪声,从而导致不同细胞测序效率的差异。噪声源可以用插入式RNA标准来建模。确定细胞亚群的库和它们之间的各种基因是具有挑战性的。因此,建议选择与特定组织生物信息相关的已知转录因子或基因子集。还建议使用聚类算法(如层次聚类、K-means聚类)来根据这些基因在不同细胞中的表达来识别特定的细胞类型。
此外,未来的工作应该包括在短时间内生成两个或多个数量级的大数据,以产生更多的单细胞信息。我们预计,在未来,更多的研究将专注于发展强大的scRNA-seq技术,这将有助于解开单个细胞在各种人类疾病中的功能,并显示出巨大的前景,在生物学和临床应用中。
风吹麦浪,春回大地。明日起,东方打工人正式上线,我们也看到越来越多的中国技术正在与世界同行同台竞技。在单细胞技术纵深发展的一年里,在思考如何突破的每一个深夜里,在早晚通勤的路上,我们向着青草更青处漫溯,不负韶华。大年初一到初六,单细胞天地2021年新春特辑,感谢您的陪伴!
注:<单细胞时代 · 2021春节系列> 是参考学术或媒体文章整理而来,个人水平有限,错讹难免,还请读者诸君批评指正。内容均为个人观点,不代表任何单位,也不构成就业或投资建议,图片来自网络,侵删。
References
[1]
https://www.mdpi.com/2073-4409/9/5/1130
如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程
看完记得顺手点个“在看”哦!
长按扫码可关注